El testimonio parcial de los logs: Evaluación de la generación de modelos de lenguaje bajo elección de modelo confundida
<meta name=description content=Descubre cómo los logs parciales pueden sesgar la evaluación de LLMs y llevar a elecciones confundidas. Análisis clave para mejorar la selección de modelos de lenguaje.>